Arbre BIC optimal et taux d'erreur
نویسنده
چکیده
Résumé. Nous reconsidérons dans cet article le critère BIC pour arbres d’induction proposé dans Ritschard et Zighed (2003, 2004) et discutons deux aspects liés à sa portée. Le premier concerne les possibilités de le calculer. Nous montrons comment il s’obtient à partir des statistiques du rapport vraisemblance utilisées pour tester l’indépendance ligne-colonne de tables de contingence. Le second point porte sur son intérêt dans une optique de classification. Nous illustrons sur l’exemple du Titanic la relation entre le BIC et le taux d’erreur en généralisation lorsqu’on regarde leur évolution selon la complexité de l’arbre. Nous esquissons un plan d’expérimentation en vue de vérifier la conjecture selon laquelle le BIC minimum assurerait en moyenne le meilleur taux d’erreur en généralisation.
منابع مشابه
Strong and weak error estimates for the solutions of elliptic partial differential equations with random coefficients
We consider the problem of numerically approximating the solution of an elliptic partial di erential equation with random coe cients and homogeneous Dirichlet boundary conditions. We focus on the case of a lognormal coe cient, we have then to deal with the lack of uniform coercivity and uniform boundedness with respect to the randomness. This model is frequently used in hydrogeology. We approxi...
متن کاملUsage non classificatoire d'arbres de classification : enseignements d'une analyse de la participation féminine à l'emploi en Suisse
Résumé. Cet article présente une application en grandeur réelle des arbres de classification dans un contexte non classificatoire. Les arbres générés visent à mettre en lumière les différences régionales dans la façon dont les femmes décident de leur participation au marché du travail. L’accent est donc mis sur la capacité descriptive plutôt que prédictive des arbres. L’application porte sur de...
متن کاملOn the convergence rate of spectral approximation for the equations for nonhomogeneous asymmetric fluids
— We study the convergence rate of solutions of spectral semi-Galerkin approximations for the équations for the motion of a nonhomogeneous incompressible asymmetrie fluid in a bounded domain. We find error estimâtes that are optimal in the H -norm as well as improved Résumé. — On étudie le taux de convergence d'une approximation de type semi-Galerkin spectrale vers la solution des équations du ...
متن کاملAnalysis of Some Finite Elements for the Stokes Problem
We study some finite elements which are used in the approximation of the Stokes problem, so as to obtain error estimates of optimal order. Résumé. Nous étudions deux éléments finis utilisés pour l'approximation du problème de Stokes et obtenons des estimations d'erreur d'ordre optimal.
متن کاملValidation statistique des cartes de Kohonen en apprentissage supervisé
Résumé. En apprentissage supervisé, la prédiction de la classe est le but ultime. Plus largement, on attend d'une bonne méthodologie d'apprentissage qu'elle permette une représentation des données susceptible de faciliter la navigation de l'utilisateur dans la base d'exemples et d'aider au choix des exemples et des variables pertinents tout en assurant une prédiction de qualité dont on comprenn...
متن کامل